1 PRE-TRATAMIENTO

1.1 Importamos los datos:

datos <- read_excel("Base_Pembro_1L_febrero_24__v2.xlsx", sheet = "datos")
## New names:
## • `Estudios` -> `Estudios...14`
## • `Est_civil` -> `Est_civil...15`
## • `Comp_hogar` -> `Comp_hogar...16`
## • `MOSs` -> `MOSs...17`
## • `Ansiedad` -> `Ansiedad...18`
## • `Depresion` -> `Depresion...19`
## • `MNA` -> `MNA...20`
## • `MNA` -> `MNA...27`
## • `Estudios` -> `Estudios...29`
## • `Est_civil` -> `Est_civil...31`
## • `Comp_hogar` -> `Comp_hogar...32`
## • `MOSs` -> `MOSs...33`
## • `Ansiedad` -> `Ansiedad...36`
## • `Depresion` -> `Depresion...37`

Eliminamos las dos filas incompletas:

datos <- datos[-c(17, 21), ]

1.2 Unificamos las columnas repetidas:

datos <- datos %>%
  mutate(estudios = coalesce(`Estudios...14`, `Estudios...29`)) %>%
  select(-`Estudios...14`, -`Estudios...29`)

datos <- datos %>%
  mutate(est_civil = coalesce(`Est_civil...15`, `Est_civil...31`)) %>%
  select(-`Est_civil...15`, -`Est_civil...31`)

datos <- datos %>%
  mutate(hogar = coalesce(`Comp_hogar...16`, `Comp_hogar...32`)) %>%
  select(-`Comp_hogar...16`, -`Comp_hogar...32`)

datos <- datos %>%
  mutate(MOOSs = coalesce(`MOSs...17`, `MOSs...33`)) %>%
  select(-`MOSs...17`, -`MOSs...33`)

datos <- datos %>%
  mutate(ansiedad = coalesce(`Ansiedad...18`, `Ansiedad...36`)) %>%
  select(-`Ansiedad...18`, -`Ansiedad...36`)

datos <- datos %>%
  mutate(depresion = coalesce(`Depresion...19`, `Depresion...37`)) %>%
  select(-`Depresion...19`, -`Depresion...37`)

datos <- datos %>%
  mutate(MNA = coalesce(`MNA...20`, `MNA...27`)) %>%
  select(-`MNA...20`, -`MNA...27`)

1.3 Eliminamos las variables que no nos interesan:

Variables de ancianos:

datos <- datos %>% select(-G8, -Audicion, -Barthel, -Lawton_Brody, -SPPB, -Caida_6m, -Pfeiffer, -Mini_mental, -Social_Gijon, -Yesavage,-CIRS, -Charlson,-Polifarmacia,
                          -Sd_geriatr, -Clasif_geriatr_SIOG1, -Clasif_geriatr_Balducci, -Observaciones, -`CD4+_C_CD45`, -`CD45+_C`, -CD3_C_Leuc, -LDH_PE, -Prot_PE,
                          -Alb_PE, -Hb_PE, -Leucoc_PE, -Neutr_PE,-Linf_PE, -Plaq_PE, -NLR_PE, -`NLRPE_corte 4`, -`NLRPE_corte 5`, - PLR_PE, -PNI_PE, -SII_PE)

Fechas:

datos <- datos %>% select(-Fecha_SLP,-Fecha_últ_control,-Fecha_exitus,-Fecha_SG,-Fecha_nac, -Fecha_dx,-Fecha_inicio_pem)

Variables que dependen de casos concretos:

datos <- datos %>% select(-Estado_mut,-Tipo_mut_Tej,-Biopsia_liq,-Tipo_mut_Liq)

1.4 Modificamos el nombre de las variables que nos pueden dar problemas:

names(datos)[names(datos) == "Joven(0)_Anciano(1)"] <- "Anciano"
names(datos)[names(datos) == "%_perd_peso"] <- "Porcentaje_perdpeso"
names(datos)[names(datos) == "PD-L1"] <- "PD_L1"
names(datos)[names(datos) == "1ª_eval"] <- "primera_eval"
names(datos)[names(datos) == "1ªeval_num"] <- "primera_eval_num"
names(datos)[names(datos) == "Toxicidad_si/no"] <- "Toxicidad"
names(datos)[names(datos) == "Progresión_sí/no"] <- "Progresion"
names(datos)[names(datos) == "2ªL_sí/no"] <- "segunda_eval"
names(datos)[names(datos) == "Exitus_sí/no"] <- "Exitus"
names(datos)[names(datos) == "T"] <- "Tamaño_tumor"
names(datos)[names(datos) == "N"] <- "Afectacion_ganglionar"
names(datos)[names(datos) == "M"] <- "Afectacion_metastasica"

2 ESTUDIO DE LOS VALORES FALTANTES:

tabla_faltantes = datos %>%
  summarise(across(everything(), ~mean(is.na(.)))) %>%
  pivot_longer(everything(), names_to = "Columna", values_to = "Porcentaje_NA") %>%
  mutate(Porcentaje_NA = Porcentaje_NA * 100)
as.data.frame(tabla_faltantes[order(tabla_faltantes$Porcentaje_NA, decreasing = TRUE),])
##                     Columna Porcentaje_NA
## 1     CD127-/lowFoxP3+_%CD4     91.176471
## 2         CD25+FoxP3+_%Linf     91.176471
## 3          CD39+FoxP3+_%CD4     91.176471
## 4                CD4+_%CD45     91.176471
## 5                     CD45+     91.176471
## 6             CD45RA+_%Linf     91.176471
## 7        CD45RA+FoxP3+_%CD4     91.176471
## 8        Helios+FoxP3+_%CD4     91.176471
## 9    CD127-/lowFoxP3+_C_CD4     91.176471
## 10       CD25+FoxP3+_C_Linf     91.176471
## 11        CD39+FoxP3+_C_CD4     91.176471
## 12           CD45RA+_C_Linf     91.176471
## 13      CD45RA+FoxP3+_C_CD4     91.176471
## 14      Helios+FoxP3+_C_CD4     91.176471
## 15      CD25+CD127low_%Linf     73.529412
## 16     CD25+CD127low_C_Linf     73.529412
## 17          HLADR+Lin_%Leuc     64.705882
## 18                mDC_%Leuc     64.705882
## 19                pDC_%Leuc     64.705882
## 20    CD4_Central_Mem_%Linf     64.705882
## 21   CD4_Effector_Mem_%Linf     64.705882
## 22          CD4_Naïve_%Linf     64.705882
## 23          CD4_TEMRA_%Linf     64.705882
## 24    CD8_Central_Mem_%Linf     64.705882
## 25   CD8_Effector_Mem_%Linf     64.705882
## 26          CD8_Naïve_%Linf     64.705882
## 27          CD8_TEMRA_%Linf     64.705882
## 28            mDC_CD16_%mDC     64.705882
## 29            mDC_CD1c_%mDC     64.705882
## 30          mDC_Clec9A_%mDC     64.705882
## 31               CD3+_%Linf     64.705882
## 32     CD27-CD57+CD3+_%Linf     64.705882
## 33      CD27-CD57+CD4+_%CD3     64.705882
## 34      CD27-CD57+CD8+_%CD3     64.705882
## 35                CD3_%Leuc     64.705882
## 36           CD3+CD4+_%Linf     64.705882
## 37          CD3+CD57+_%Linf     64.705882
## 38           CD3+CD8+_%Linf     64.705882
## 39   CD45RA+CCR7+CD3+_%Linf     64.705882
## 40     CD8+_term_efect_%CD3     64.705882
## 41       CD8_exhausted_%CD3     64.705882
## 42         CD4_TCR_ab+_%CD3     64.705882
## 43               CD4+_%Linf     64.705882
## 44        CD8+_TCR_ab+_%CD3     64.705882
## 45               CD8+_%Linf     64.705882
## 46           CD8+CD4+_%Linf     64.705882
## 47           CD8-CD4-_%Linf     64.705882
## 48         HLADR+CD3+_%Linf     64.705882
## 49                    Leuc%     64.705882
## 50                    Linf%     64.705882
## 51            TCR_ab+_%Linf     64.705882
## 52            TCR_gd+_%Linf     64.705882
## 53             gd_VD1+_%CD3     64.705882
## 54         gd_VD1+VD2+_%CD3     64.705882
## 55         gd_VD1-VD2-_%CD3     64.705882
## 56             gd_VD2+_%CD3     64.705882
## 57          CD25+CD4+_%Linf     61.764706
## 58         HLADR+Lin_C_Leuc     61.764706
## 59               mDC_C_Leuc     61.764706
## 60               pDC_C_Leuc     61.764706
## 61   CD4_Central_Mem_C_Linf     61.764706
## 62  CD4_Effector_Mem_C_Linf     61.764706
## 63         CD4_Naïve_C_Linf     61.764706
## 64         CD4_TEMRA_C_Linf     61.764706
## 65   CD8_Central_Mem_C_Linf     61.764706
## 66  CD8_Effector_Mem_C_Linf     61.764706
## 67         CD8_Naïve_C_Linf     61.764706
## 68         CD8_TEMRA_C_Linf     61.764706
## 69           mDC_CD16_C_mDC     61.764706
## 70           mDC_CD1c_C_mDC     61.764706
## 71         mDC_Clec9A_C_mDC     61.764706
## 72              CD3+_C_Linf     61.764706
## 73    CD27-CD57+CD3+_C_Linf     61.764706
## 74     CD27-CD57+CD4+_C_CD3     61.764706
## 75     CD27-CD57+CD8+_C_CD3     61.764706
## 76          CD3+CD4+_C_Linf     61.764706
## 77         CD3+CD57+_C_Linf     61.764706
## 78          CD3+CD8+_C_Linf     61.764706
## 79  CD45RA+CCR7+CD3+_C_Linf     61.764706
## 80    CD8+_term_efect_C_CD3     61.764706
## 81      CD8_exhausted_C_CD3     61.764706
## 82        CD4_TCR_ab+_C_CD3     61.764706
## 83              CD4+_C_Linf     61.764706
## 84       CD8+_TCR_ab+_C_CD3     61.764706
## 85              CD8+_C_Linf     61.764706
## 86          CD8+CD4+_C_Linf     61.764706
## 87          CD8-CD4-_C_Linf     61.764706
## 88        HLADR+CD3+_C_Linf     61.764706
## 89           TCR_ab+_C_Linf     61.764706
## 90           TCR_gd+_C_Linf     61.764706
## 91            gd_VD1+_C_CD3     61.764706
## 92        gd_VD1+VD2+_C_CD3     61.764706
## 93        gd_VD1-VD2-_C_CD3     61.764706
## 94            gd_VD2+_C_CD3     61.764706
## 95         CD25+CD4+_C_Linf     61.764706
## 96                    MOOSs     61.764706
## 97                     IL-6     58.823529
## 98                  IgM_CMV     55.882353
## 99                  IgG_CMV     55.882353
## 100                 Col_LDL     47.058824
## 101                  LDH_2C     47.058824
## 102                     MNA     47.058824
## 103                ansiedad     44.117647
## 104               depresion     44.117647
## 105                 Col_HDL     41.176471
## 106        Fecha_progresión     38.235294
## 107                 Num_pac     35.294118
## 108                  LDH_1C     35.294118
## 109               LDH_1eval     29.411765
## 110               LinfT_cel     26.470588
## 111                 LinfT_%     26.470588
## 112                 CD4_cel     26.470588
## 113                   CD4_%     26.470588
## 114                 CD8_cel     26.470588
## 115                   CD8_%     26.470588
## 116                 CD4:CD8     26.470588
## 117               LinfB_cel     26.470588
## 118                 LinfB_%     26.470588
## 119              LinfNK_cel     26.470588
## 120                LinfNK_%     26.470588
## 121                estudios     26.470588
## 122               est_civil     26.470588
## 123                     PCR     23.529412
## 124                   hogar     23.529412
## 125            segunda_eval     20.588235
## 126                 Prot_2C     11.764706
## 127                Tipo_tox     11.764706
## 128     Porcentaje_perdpeso      8.823529
## 129            p_peso_no_sí      8.823529
## 130                     LDH      8.823529
## 131                 Prot_1C      8.823529
## 132                  Alb_2C      8.823529
## 133                  PNI_2C      8.823529
## 134              Prot_1eval      8.823529
## 135               Hab_tabaq      5.882353
## 136                 Exp_tab      5.882353
## 137                  Alb_1C      5.882353
## 138                   Hb_2C      5.882353
## 139               Leucoc_2C      5.882353
## 140                Neutr_2C      5.882353
## 141                 Linf_2C      5.882353
## 142                 Plaq_2C      5.882353
## 143                  NLR_2C      5.882353
## 144          NLR2C_corte4o5      5.882353
## 145                  PLR_2C      5.882353
## 146                  SII_2C      5.882353
## 147            Tamaño_tumor      2.941176
## 148   Afectacion_ganglionar      2.941176
## 149  Afectacion_metastasica      2.941176
## 150               Col_total      2.941176
## 151                Prot_tot      2.941176
## 152                Albumina      2.941176
## 153                 PNI_pre      2.941176
## 154                 ALI_pre      2.941176
## 155            NLR1C_corte5      2.941176
## 156                  PNI_1C      2.941176
## 157                   Idpac      0.000000
## 158                    Sexo      0.000000
## 159                 Edad_dx      0.000000
## 160                 Anciano      0.000000
## 161                    ECOG      0.000000
## 162                    Peso      0.000000
## 163                   Talla      0.000000
## 164                     IMC      0.000000
## 165                Diabetes      0.000000
## 166                 Cardiop      0.000000
## 167              Enf_neurod      0.000000
## 168              Histologia      0.000000
## 169          Histología_num      0.000000
## 170                 Estadio      0.000000
## 171             Estadio_num      0.000000
## 172                   PD_L1      0.000000
## 173               Estatinas      0.000000
## 174                      Hb      0.000000
## 175              Leucoc_tot      0.000000
## 176             Neutrofilos      0.000000
## 177                Linf_tot      0.000000
## 178               Plaquetas      0.000000
## 179                 NLR_pre      0.000000
## 180                 PLR_pre      0.000000
## 181                 SII_pre      0.000000
## 182                   Hb_1C      0.000000
## 183               Leucoc_1C      0.000000
## 184                Neutr_1C      0.000000
## 185                 Linf_1C      0.000000
## 186                 Plaq_1C      0.000000
## 187                  NLR_1C      0.000000
## 188            NLR1C_corte4      0.000000
## 189                  PLR_1C      0.000000
## 190                  SII_1C      0.000000
## 191            primera_eval      0.000000
## 192        primera_eval_num      0.000000
## 193               Alb_1eval      0.000000
## 194                Hb_1eval      0.000000
## 195            Leucoc_1eval      0.000000
## 196             Neutr_1eval      0.000000
## 197              Linf_1eval      0.000000
## 198              Plaq_1eval      0.000000
## 199               NLR_1eval      0.000000
## 200               PLR_1eval      0.000000
## 201               PNI_1eval      0.000000
## 202               SII_1eval      0.000000
## 203              Mejor_resp      0.000000
## 204          Mejor_resp_num      0.000000
## 205                N_ciclos      0.000000
## 206               Toxicidad      0.000000
## 207               Grado_tox      0.000000
## 208           Interrupc_tto      0.000000
## 209            Motivo_inter      0.000000
## 210              Progresion      0.000000
## 211                  Exitus      0.000000
## 212                     SLP      0.000000
## 213                SLP_cens      0.000000
## 214                      SG      0.000000
## 215                 SG_cens      0.000000

Nos interesa quedarnos con aquellas variables que presenten menos de un 23% de valores faltantes, por ello, vamos a eliminar aquellas que superen nuestro límite.

variables_a_eliminar <- tabla_faltantes %>%
  filter(Porcentaje_NA > 23) %>%
  pull(Columna)

df <- datos %>%
  select(-one_of(variables_a_eliminar))
tabla_faltantes = df %>%
  summarise(across(everything(), ~mean(is.na(.)))) %>%
  pivot_longer(everything(), names_to = "Columna", values_to = "Porcentaje_NA") %>%
  mutate(Porcentaje_NA = Porcentaje_NA * 100)
as.data.frame(tabla_faltantes[order(tabla_faltantes$Porcentaje_NA, decreasing = TRUE),])
##                   Columna Porcentaje_NA
## 1            segunda_eval     20.588235
## 2                 Prot_2C     11.764706
## 3                Tipo_tox     11.764706
## 4     Porcentaje_perdpeso      8.823529
## 5            p_peso_no_sí      8.823529
## 6                     LDH      8.823529
## 7                 Prot_1C      8.823529
## 8                  Alb_2C      8.823529
## 9                  PNI_2C      8.823529
## 10             Prot_1eval      8.823529
## 11              Hab_tabaq      5.882353
## 12                Exp_tab      5.882353
## 13                 Alb_1C      5.882353
## 14                  Hb_2C      5.882353
## 15              Leucoc_2C      5.882353
## 16               Neutr_2C      5.882353
## 17                Linf_2C      5.882353
## 18                Plaq_2C      5.882353
## 19                 NLR_2C      5.882353
## 20         NLR2C_corte4o5      5.882353
## 21                 PLR_2C      5.882353
## 22                 SII_2C      5.882353
## 23           Tamaño_tumor      2.941176
## 24  Afectacion_ganglionar      2.941176
## 25 Afectacion_metastasica      2.941176
## 26              Col_total      2.941176
## 27               Prot_tot      2.941176
## 28               Albumina      2.941176
## 29                PNI_pre      2.941176
## 30                ALI_pre      2.941176
## 31           NLR1C_corte5      2.941176
## 32                 PNI_1C      2.941176
## 33                  Idpac      0.000000
## 34                   Sexo      0.000000
## 35                Edad_dx      0.000000
## 36                Anciano      0.000000
## 37                   ECOG      0.000000
## 38                   Peso      0.000000
## 39                  Talla      0.000000
## 40                    IMC      0.000000
## 41               Diabetes      0.000000
## 42                Cardiop      0.000000
## 43             Enf_neurod      0.000000
## 44             Histologia      0.000000
## 45         Histología_num      0.000000
## 46                Estadio      0.000000
## 47            Estadio_num      0.000000
## 48                  PD_L1      0.000000
## 49              Estatinas      0.000000
## 50                     Hb      0.000000
## 51             Leucoc_tot      0.000000
## 52            Neutrofilos      0.000000
## 53               Linf_tot      0.000000
## 54              Plaquetas      0.000000
## 55                NLR_pre      0.000000
## 56                PLR_pre      0.000000
## 57                SII_pre      0.000000
## 58                  Hb_1C      0.000000
## 59              Leucoc_1C      0.000000
## 60               Neutr_1C      0.000000
## 61                Linf_1C      0.000000
## 62                Plaq_1C      0.000000
## 63                 NLR_1C      0.000000
## 64           NLR1C_corte4      0.000000
## 65                 PLR_1C      0.000000
## 66                 SII_1C      0.000000
## 67           primera_eval      0.000000
## 68       primera_eval_num      0.000000
## 69              Alb_1eval      0.000000
## 70               Hb_1eval      0.000000
## 71           Leucoc_1eval      0.000000
## 72            Neutr_1eval      0.000000
## 73             Linf_1eval      0.000000
## 74             Plaq_1eval      0.000000
## 75              NLR_1eval      0.000000
## 76              PLR_1eval      0.000000
## 77              PNI_1eval      0.000000
## 78              SII_1eval      0.000000
## 79             Mejor_resp      0.000000
## 80         Mejor_resp_num      0.000000
## 81               N_ciclos      0.000000
## 82              Toxicidad      0.000000
## 83              Grado_tox      0.000000
## 84          Interrupc_tto      0.000000
## 85           Motivo_inter      0.000000
## 86             Progresion      0.000000
## 87                 Exitus      0.000000
## 88                    SLP      0.000000
## 89               SLP_cens      0.000000
## 90                     SG      0.000000
## 91                SG_cens      0.000000

El siguiente paso es tratar estos valores faltantes para poder realizar nuestro análisis.

3 IMPUTACIÓN:

Para realizar la imputación vamos a utilizar la librería mice. Primero de todo, nos interesa conocer de que tipo son nuestras variables:

tipos_var <- data.frame(Columna = names(df))
tipos_var$Tipo <- sapply(df, function(x) class(x)[1])
tipos_var
##                   Columna      Tipo
## 1                   Idpac character
## 2                    Sexo   numeric
## 3                 Edad_dx   numeric
## 4                 Anciano   numeric
## 5                    ECOG   numeric
## 6                    Peso   numeric
## 7                   Talla   numeric
## 8                     IMC   numeric
## 9     Porcentaje_perdpeso   numeric
## 10           p_peso_no_sí   numeric
## 11              Hab_tabaq   numeric
## 12                Exp_tab   numeric
## 13               Diabetes   numeric
## 14                Cardiop   numeric
## 15             Enf_neurod   numeric
## 16             Histologia character
## 17         Histología_num   numeric
## 18           Tamaño_tumor character
## 19  Afectacion_ganglionar character
## 20 Afectacion_metastasica character
## 21                Estadio character
## 22            Estadio_num   numeric
## 23                  PD_L1   numeric
## 24              Estatinas character
## 25              Col_total   numeric
## 26                    LDH   numeric
## 27               Prot_tot   numeric
## 28               Albumina   numeric
## 29                     Hb   numeric
## 30             Leucoc_tot   numeric
## 31            Neutrofilos   numeric
## 32               Linf_tot   numeric
## 33              Plaquetas   numeric
## 34                NLR_pre   numeric
## 35                PLR_pre   numeric
## 36                PNI_pre   numeric
## 37                ALI_pre   numeric
## 38                SII_pre   numeric
## 39                Prot_1C   numeric
## 40                 Alb_1C   numeric
## 41                  Hb_1C   numeric
## 42              Leucoc_1C   numeric
## 43               Neutr_1C   numeric
## 44                Linf_1C   numeric
## 45                Plaq_1C   numeric
## 46                 NLR_1C   numeric
## 47           NLR1C_corte4   numeric
## 48           NLR1C_corte5   numeric
## 49                 PLR_1C   numeric
## 50                 PNI_1C   numeric
## 51                 SII_1C   numeric
## 52                Prot_2C   numeric
## 53                 Alb_2C   numeric
## 54                  Hb_2C   numeric
## 55              Leucoc_2C   numeric
## 56               Neutr_2C   numeric
## 57                Linf_2C   numeric
## 58                Plaq_2C   numeric
## 59                 NLR_2C   numeric
## 60         NLR2C_corte4o5   numeric
## 61                 PLR_2C   numeric
## 62                 PNI_2C   numeric
## 63                 SII_2C   numeric
## 64           primera_eval character
## 65       primera_eval_num   numeric
## 66             Prot_1eval   numeric
## 67              Alb_1eval   numeric
## 68               Hb_1eval   numeric
## 69           Leucoc_1eval   numeric
## 70            Neutr_1eval   numeric
## 71             Linf_1eval   numeric
## 72             Plaq_1eval   numeric
## 73              NLR_1eval   numeric
## 74              PLR_1eval   numeric
## 75              PNI_1eval   numeric
## 76              SII_1eval   numeric
## 77             Mejor_resp character
## 78         Mejor_resp_num   numeric
## 79               N_ciclos   numeric
## 80              Toxicidad   numeric
## 81               Tipo_tox character
## 82              Grado_tox character
## 83          Interrupc_tto   numeric
## 84           Motivo_inter character
## 85             Progresion   numeric
## 86           segunda_eval   numeric
## 87                 Exitus   numeric
## 88                    SLP   numeric
## 89               SLP_cens   numeric
## 90                     SG   numeric
## 91                SG_cens   numeric

Como podemos observar tenemos variables tanto numéricas como categóricas, por lo que nos interesa transformar esas variables categóricas en factores para poder imputar a través del método de la media , incluso, alguna numérica.

df$Idpac <- as.factor(df$Idpac)
df$Histologia <- as.factor(df$Histologia)
df$Tamaño_tumor <- as.factor(df$Tamaño_tumor)
df$Afectacion_ganglionar <- as.factor(df$Afectacion_ganglionar)
df$Afectacion_metastasica <- as.factor(df$Afectacion_metastasica)
df$Estadio <- as.factor(df$Estadio)
df$Estatinas <- as.factor(df$Estatinas)
df$primera_eval_num <- as.factor(df$primera_eval_num)
df$Mejor_resp_num <- as.factor(df$Mejor_resp_num)
df$Tipo_tox <- as.factor(df$Tipo_tox)
df$Grado_tox <- as.factor(df$Grado_tox)
df$Motivo_inter <- as.factor(df$Motivo_inter)
df$p_peso_no_sí <- as.factor(df$p_peso_no_sí)
df$Hab_tabaq <- as.factor(df$Hab_tabaq)
df$NLR1C_corte4 <- as.factor(df$NLR1C_corte4)
df$NLR1C_corte5 <- as.factor(df$NLR1C_corte5)
df$Histología_num <- as.factor(df$Histología_num)
df$Estadio_num <- as.factor(df$Estadio_num)
df$Toxicidad <- as.factor(df$Toxicidad)
df$Interrupc_tto <- as.factor(df$Interrupc_tto)
df$Enf_neurod <- as.factor(df$Enf_neurod)
df$Sexo <- as.factor(df$Sexo)
df$ECOG <- as.factor(df$ECOG)
df$Progresion <- as.factor(df$Progresion)
df$Cardiop <- as.factor(df$Cardiop)
df$Diabetes <- as.factor(df$Diabetes)

Comprobamos que hemos hecho el cambio correctamente:

tipos_var2 <- data.frame(Columna = names(df))
tipos_var2$Tipo <- sapply(df, function(x) class(x)[1])
tipos_var2
##                   Columna      Tipo
## 1                   Idpac    factor
## 2                    Sexo    factor
## 3                 Edad_dx   numeric
## 4                 Anciano   numeric
## 5                    ECOG    factor
## 6                    Peso   numeric
## 7                   Talla   numeric
## 8                     IMC   numeric
## 9     Porcentaje_perdpeso   numeric
## 10           p_peso_no_sí    factor
## 11              Hab_tabaq    factor
## 12                Exp_tab   numeric
## 13               Diabetes    factor
## 14                Cardiop    factor
## 15             Enf_neurod    factor
## 16             Histologia    factor
## 17         Histología_num    factor
## 18           Tamaño_tumor    factor
## 19  Afectacion_ganglionar    factor
## 20 Afectacion_metastasica    factor
## 21                Estadio    factor
## 22            Estadio_num    factor
## 23                  PD_L1   numeric
## 24              Estatinas    factor
## 25              Col_total   numeric
## 26                    LDH   numeric
## 27               Prot_tot   numeric
## 28               Albumina   numeric
## 29                     Hb   numeric
## 30             Leucoc_tot   numeric
## 31            Neutrofilos   numeric
## 32               Linf_tot   numeric
## 33              Plaquetas   numeric
## 34                NLR_pre   numeric
## 35                PLR_pre   numeric
## 36                PNI_pre   numeric
## 37                ALI_pre   numeric
## 38                SII_pre   numeric
## 39                Prot_1C   numeric
## 40                 Alb_1C   numeric
## 41                  Hb_1C   numeric
## 42              Leucoc_1C   numeric
## 43               Neutr_1C   numeric
## 44                Linf_1C   numeric
## 45                Plaq_1C   numeric
## 46                 NLR_1C   numeric
## 47           NLR1C_corte4    factor
## 48           NLR1C_corte5    factor
## 49                 PLR_1C   numeric
## 50                 PNI_1C   numeric
## 51                 SII_1C   numeric
## 52                Prot_2C   numeric
## 53                 Alb_2C   numeric
## 54                  Hb_2C   numeric
## 55              Leucoc_2C   numeric
## 56               Neutr_2C   numeric
## 57                Linf_2C   numeric
## 58                Plaq_2C   numeric
## 59                 NLR_2C   numeric
## 60         NLR2C_corte4o5   numeric
## 61                 PLR_2C   numeric
## 62                 PNI_2C   numeric
## 63                 SII_2C   numeric
## 64           primera_eval character
## 65       primera_eval_num    factor
## 66             Prot_1eval   numeric
## 67              Alb_1eval   numeric
## 68               Hb_1eval   numeric
## 69           Leucoc_1eval   numeric
## 70            Neutr_1eval   numeric
## 71             Linf_1eval   numeric
## 72             Plaq_1eval   numeric
## 73              NLR_1eval   numeric
## 74              PLR_1eval   numeric
## 75              PNI_1eval   numeric
## 76              SII_1eval   numeric
## 77             Mejor_resp character
## 78         Mejor_resp_num    factor
## 79               N_ciclos   numeric
## 80              Toxicidad    factor
## 81               Tipo_tox    factor
## 82              Grado_tox    factor
## 83          Interrupc_tto    factor
## 84           Motivo_inter    factor
## 85             Progresion    factor
## 86           segunda_eval   numeric
## 87                 Exitus   numeric
## 88                    SLP   numeric
## 89               SLP_cens   numeric
## 90                     SG   numeric
## 91                SG_cens   numeric

Vemos la distribución de los datos faltantes:

patrones = md.pattern(df, rotate.names = TRUE)

Ahora procedemos a imputar los datos con el método de la media:

imputed_data1 <- mice(df %>% 
                        select(-Idpac,-Histologia,-Afectacion_ganglionar, -Afectacion_metastasica,-Estadio,-Estatinas,-primera_eval_num, -Mejor_resp_num,
                               -Tipo_tox, -Tamaño_tumor, -Grado_tox, -Motivo_inter, -p_peso_no_sí, -Hab_tabaq, -NLR1C_corte4, -NLR1C_corte5,-Histología_num,
                               -Estadio_num, -Toxicidad,-Interrupc_tto,-Enf_neurod,-Sexo,-ECOG, -Progresion, -Cardiop, -Diabetes),
                      method = "mean", print = FALSE)
## Warning: Number of logged events: 752
df_imputado1 <- complete(imputed_data1)
df_imputado1
##     Edad_dx Anciano  Peso Talla      IMC Porcentaje_perdpeso   Exp_tab PD_L1
## 1  46.00000       0  88.0  1.77 28.08899          0.04583871  20.00000   100
## 2  68.00000       0  85.0  1.55 35.37981          0.00000000   0.00000    70
## 3  59.00000       0  65.0  1.59 25.71101          0.00000000  45.00000    50
## 4  72.00000       1  88.5  1.77 28.24859          0.00000000  92.00000     2
## 5  50.00000       0  90.0  1.76 29.05475          0.10000000  55.00000    60
## 6  71.00000       1  76.6  1.63 28.83059          0.00000000 200.00000    90
## 7  71.00000       1  67.0  1.50 29.77778          0.07600000  60.00000   100
## 8  79.00000       1  67.0  1.61 25.84777          0.00000000  40.00000    70
## 9  73.14168       1  63.0  1.68 22.32143          0.04583871  50.00000    90
## 10 68.51745       0  77.5  1.81 23.65618          0.00000000  50.00000    70
## 11 56.48734       0  73.8  1.75 24.09796          0.04583871  36.00000    80
## 12 66.27242       0  66.3  1.63 24.95389          0.22900000  50.00000    50
## 13 61.96304       0  63.8  1.56 26.21631          0.13800000   0.00000    80
## 14 64.45996       0  65.0  1.79 20.28651          0.11000000  50.00000   100
## 15 58.70500       0  53.0  1.55 22.06035          0.00000000  25.00000    95
## 16 60.30664       0  72.0  1.71 24.62296          0.00000000  82.00000    90
## 17 63.00000       0  67.0  1.50 29.77778          0.00000000  60.00000   100
## 18 82.00000       1  61.0  1.63 22.95909          0.00000000 100.00000    90
## 19 66.00000       0  64.2  1.61 24.76756          0.00000000  50.00000    60
## 20 50.00000       0  55.0  1.63 20.70082          0.00000000  51.65625   100
## 21 78.00000       1  69.0  1.55 28.72008          0.06700000  75.00000    70
## 22 73.00000       1 102.0  1.91 27.95976          0.01000000  83.00000    70
## 23 60.00000       0  67.0  1.73 22.38631          0.13000000  40.00000   100
## 24 70.00000       1  64.7  1.60 25.27344          0.03000000  51.65625    90
## 25 64.00000       0  47.0  1.60 18.35937          0.03100000  40.00000    70
## 26 57.00000       0  61.0  1.62 23.24341          0.04000000  30.00000    70
## 27 71.00000       1  52.0  1.56 21.36752          0.05500000   0.00000    80
## 28 75.00000       1  62.0  1.60 24.21875          0.08800000  25.00000   100
## 29 68.00000       0  75.0  1.68 26.57313          0.03800000  40.00000    90
## 30 62.00000       0  80.0  1.72 27.04164          0.00000000  60.00000    90
## 31 51.00000       0  62.0  1.81 18.92494          0.07500000  45.00000    60
## 32 80.00000       1  53.0  1.58 21.23057          0.15900000  40.00000    80
## 33 65.00000       0  85.0  1.65 31.22130          0.04500000  85.00000    95
## 34 62.00000       0  97.0  1.65 35.62902          0.00000000  25.00000    70
##    Col_total       LDH Prot_tot Albumina   Hb Leucoc_tot Neutrofilos Linf_tot
## 1   217.0000  163.0000 7.000000 4.100000 15.3      10100        8000     1400
## 2   154.0000  171.0000 6.000000 3.700000 11.8       9800        8200      800
## 3   146.0000  197.0000 7.200000 4.300000 16.7       9900        7400     1400
## 4   149.0000  159.0000 7.100000 4.000000 14.6       5600        3000     1800
## 5   210.0000  198.0000 7.900000 4.400000 15.7       8900        5300     2300
## 6   162.0000  220.0000 8.000000 4.300000 13.1       8800        6000     1600
## 7   142.0000  198.0000 6.400000 3.600000 11.5      10000        9000      400
## 8   167.0000  184.0000 7.000000 3.900000 12.3       7700        5300     1600
## 9   153.0000  176.0000 6.900000 3.700000 12.9      16200       13200     1900
## 10  132.0000  199.0000 7.300000 4.000000 13.0      15700       13400     1400
## 11  113.0000  190.0000 7.300000 3.500000 13.6      10600        8000     1500
## 12  182.0000  198.0000 6.500000 3.700000 11.4       8700        5000     2500
## 13  242.0000  184.0000 7.300000 4.100000 13.7      12600        8700     2200
## 14  133.0000  183.0000 7.000000 4.100000 13.7      11400        7600     2300
## 15  215.0000  204.0000 7.200000 4.400000 11.9      13400        9400     2900
## 16  202.0000  276.0000 5.600000 3.200000 15.5      13100       12300      500
## 17  262.0000  201.0000 5.400000 2.800000 11.6       4100        2500      800
## 18  200.0000  383.0000 8.900000 3.900000 12.1      11700        7100     2700
## 19  199.0000  382.0000 6.300000 3.700000 10.6       4000        2600      900
## 20  194.0000  156.0000 7.300000 4.300000 11.5      10800        9400      500
## 21  176.0000  175.0000 7.100000 4.300000 11.5      10600        7300     1200
## 22  160.0000  195.0000 7.300000 4.100000 12.6       7700        4800     1900
## 23  111.0000  326.0000 6.400000 3.000000 13.5       6800        5400      700
## 24  276.0000  263.6452 7.000000 3.900000 14.1       6000        3500     2000
## 25  155.0000 1644.0000 6.900000 3.400000 10.9      13800        8700     3000
## 26  197.0000  279.0000 6.900000 4.400000 13.0       6300        4300     1100
## 27  206.0000  164.0000 6.600000 4.000000 14.0       6200        4800      800
## 28  208.0000  222.0000 7.400000 4.100000 12.4       7200        4900     1500
## 29  191.0000  267.0000 6.900000 3.500000 14.5      20500       11500     3300
## 30  201.0000  248.0000 7.300000 4.200000 13.6      14100        8400     3500
## 31  142.0000  263.6452 7.100000 3.900000 12.8       9600        7100     1300
## 32  187.4545  263.6452 7.006061 3.912121 12.6       7600        5300     1300
## 33  192.0000  230.0000 7.700000 4.400000 15.3       8400        5400     1800
## 34  397.0000  201.0000 7.000000 4.200000 14.2      12500       10700     1300
##    Plaquetas   NLR_pre   PLR_pre  PNI_pre   ALI_pre   SII_pre  Prot_1C  Alb_1C
## 1     273000  5.714286 195.00000 48.00000 20.153851 1560000.0 7.500000 4.60000
## 2     124000 10.250000 155.00000 41.00000 12.771249 1271000.0 6.200000 3.90000
## 3     349000  5.285714 249.28571 50.00000 20.916253 1844714.3 7.200000 4.40000
## 4     220000  1.666667 122.22222 49.00000 67.796610  366666.7 7.048387 3.90625
## 5     350000  2.304348 152.17391 55.50000 55.478130  806521.7 7.400000 4.50000
## 6     279000  3.750000 174.37500 51.00000 33.059079 1046250.0 8.100000 4.20000
## 7     269000 22.500000 672.50000 38.00000  4.764444 6052500.0 6.500000 4.00000
## 8     201000  3.312500 125.62500 47.00000 30.432089  665812.5 7.700000 4.00000
## 9     317000  6.947368 166.84211 46.50000 11.887852 2202315.8 7.048387 3.90000
## 10    324000  9.571429 231.42857 47.00000  9.886163 3101142.9 7.400000 4.00000
## 11    489000  5.333333 326.00000 42.50000 15.814286 2608000.0 7.000000 3.40000
## 12    216000  2.000000  86.40000 49.50000 46.164703  432000.0 7.100000 4.10000
## 13    455000  3.954545 206.81818 52.00000 27.180583 1799318.2 7.300000 4.00000
## 14    274000  3.304348 119.13043 52.50000 25.171285  905391.3 7.000000 3.70000
## 15    208000  3.241379  71.72414 58.50000 29.945757  674206.9 6.900000 3.70000
## 16    112000 24.600000 224.00000 34.50000  3.202987 2755200.0 7.800000 4.20000
## 17    293000  3.125000 366.25000 32.00000 26.680889  915625.0 4.600000 3.10000
## 18    358000  2.629630 132.59259 52.50000 34.050591  941407.4 9.100000 4.00000
## 19    338000  2.888889 375.55556 41.50000 31.721533  976444.4 6.000000 3.10000
## 20    464000 18.800000 928.00000 45.50000  4.734761 8723200.0 8.000000 4.50000
## 21    158000  6.083333 131.66667 49.00000 20.300771  961166.7 7.200000 4.20000
## 22    248000  2.526316 130.52632 50.50000 45.376360  626526.3 7.300000 3.80000
## 23    335000  7.714286 478.57143 33.50000  8.705789 2584285.7 6.800000 3.60000
## 24    143000  1.750000  71.50000 49.00000 56.323661  250250.0 7.400000 3.90000
## 25    709000  2.900000 236.33333 49.00000 21.524784 2056100.0 7.300000 3.60000
## 26    287000  3.909091 260.90909 49.50000 26.162348 1121909.1 6.400000 3.70000
## 27    295000  6.000000 368.75000 44.00000 14.245014 1770000.0 6.900000 4.10000
## 28    228000  3.266667 152.00000 48.50000 30.397003  744800.0 7.100000 4.00000
## 29    271000  3.484848  82.12121 51.50000 26.688665  944393.9 6.800000 3.30000
## 30    461000  2.400000 131.71429 59.50000 47.322877 1106400.0 6.300000 3.80000
## 31    327000  5.461538 251.53846 45.50000 13.514007 1785923.1 6.500000 3.30000
## 32    249000  4.076923 191.53846 47.42424 26.858982 1015153.8 7.100000 4.30000
## 33    306000  3.000000 170.00000 53.00000 45.791246  918000.0 7.048387 3.90625
## 34    234000  8.230769 180.00000 48.50000 18.180788 1926000.0 6.600000 4.10000
##    Hb_1C Leucoc_1C Neutr_1C Linf_1C Plaq_1C    NLR_1C    PLR_1C   PNI_1C
## 1   15.9      8100     6000    1600  369000  3.750000 230.62500 54.00000
## 2   11.7      8500     7000     800  112000  8.750000 140.00000 43.00000
## 3   16.1     12000     8000    2500  382000  3.200000 152.80000 56.50000
## 4   15.5      7300     4400    2000  266000  2.200000 133.00000 10.00000
## 5   15.9      9200     4900    3100  364000  1.580645 117.41935 60.50000
## 6   14.5      8000     5300    1600  293000  3.312500 183.12500 50.00000
## 7   11.6      4500     3200     900  218000  3.555556 242.22222 44.50000
## 8   12.1      3600     1900     900  131000  2.111111 145.55556 44.50000
## 9   14.5     16100    12100    2900  380000  4.172414 131.03448 53.50000
## 10  13.5     12800     9800    1900  214000  5.157895 112.63158 49.50000
## 11  11.4     12500    10400    1000  463000 10.400000 463.00000 39.00000
## 12  11.6      7600     3700    2900  242000  1.275862  83.44828 55.50000
## 13  14.3     11300     6200    3600  452000  1.722222 125.55556 58.00000
## 14  10.8     15400    11300    2500  444000  4.520000 177.60000 49.50000
## 15  11.3     10400     8400    1000  272000  8.400000 272.00000 42.00000
## 16  13.7     14100     9700    3100  494000  3.129032 159.35484 57.50000
## 17   8.4      4800     3300     700  226000  4.714286 322.85714 34.50000
## 18  11.9     11100     6000    3000  380000  2.000000 126.66667 55.00000
## 19  11.1      3600     1700    1100  338000  1.545455 307.27273 36.50000
## 20  11.9     10900     8900    1200  465000  7.416667 387.50000 51.00000
## 21  10.2     13800     9300    1600  205000  5.812500 128.12500 50.00000
## 22  12.5      7400     4600    1800  304000  2.555556 168.88889 47.00000
## 23  16.0      4600     3000    1100  274000  2.727273 249.09091 41.50000
## 24  12.9      6000     3000    2200  277000  1.363636 125.90909 50.00000
## 25  11.1     12600     7000    3600  650000  1.944444 180.55556 54.00000
## 26  11.7      9000     6300     800  457000  7.875000 571.25000 41.00000
## 27  13.6      4900     2700    1600  192000  1.687500 120.00000 49.00000
## 28  11.7      6900     5900     600  259000  9.833333 431.66667 43.00000
## 29  14.5     12800     6800    2800  366000  2.428571 130.71429 47.00000
## 30  11.6      8700     4600    2200  553000  2.090909 251.36364 49.00000
## 31  10.5      9000     6300    1200  513000  5.250000 427.50000 39.00000
## 32  13.2     13100     8700    2900  345000  3.000000 118.96552 57.50000
## 33  15.6     10000     6800    2000  323000  3.400000 161.50000 47.33333
## 34  15.4     10200     7600    1700  208000  4.470588 122.35294 49.50000
##       SII_1C  Prot_2C   Alb_2C    Hb_2C Leucoc_2C  Neutr_2C  Linf_2C  Plaq_2C
## 1  1383750.0 7.900000 4.500000 16.50000   6400.00  3400.000 2300.000 253000.0
## 2   980000.0 6.100000 3.700000 11.40000   8300.00  6200.000 1200.000 126000.0
## 3  1222400.0 7.200000 4.400000 16.70000   8400.00  4500.000 3000.000 329000.0
## 4   585200.0 7.200000 4.100000 15.30000   7200.00  4300.000 1900.000 254000.0
## 5   575354.8 8.000000 4.500000 16.30000   9200.00  5100.000 2800.000 313000.0
## 6   970562.5 8.100000 4.500000 15.50000   8000.00  5300.000 1800.000    285.0
## 7   775111.1 7.200000 4.100000 12.40000   8200.00  6400.000 1100.000 265000.0
## 8   276555.6 7.223333 4.012903 13.15312   9106.25  5796.875 2090.625 305883.9
## 9  1585517.2 7.223333 3.700000 13.40000  19400.00 16100.000 2300.000 406000.0
## 10 1103789.5 7.500000 4.100000 13.40000   8700.00  5500.000 2200.000 226000.0
## 11 4815200.0 6.500000 2.900000  8.60000  14500.00 12100.000 1200.000 858000.0
## 12  308758.6 6.800000 3.900000 11.40000   9400.00  4400.000 3100.000 260000.0
## 13  778444.4 7.100000 4.200000 15.00000  10200.00  5100.000 2900.000 319000.0
## 14 2006880.0 7.200000 4.000000 10.90000  14700.00  9900.000 3500.000 408000.0
## 15 2284800.0 7.200000 3.900000 11.20000  10600.00  7900.000 1400.000 254000.0
## 16 1545741.9 7.200000 3.900000 13.30000   9900.00  6100.000 2500.000 297000.0
## 17 1065428.6 5.300000 3.000000 10.30000   3800.00  2300.000  800.000 218000.0
## 18  760000.0 8.800000 4.100000 12.90000  11200.00  6100.000 3300.000 272000.0
## 19  522363.6 6.700000 3.700000 11.60000   4000.00  1800.000 1500.000 394000.0
## 20 3448750.0 7.900000 4.600000 12.30000   8600.00  6300.000 1200.000 425000.0
## 21 1191562.5 6.900000 4.400000 10.40000  12500.00  8500.000 1500.000 217000.0
## 22  776888.9 7.700000 3.900000 13.40000   6400.00  3600.000 1800.000 194000.0
## 23  747272.7 7.800000 3.600000 15.80000   5400.00  3700.000 1000.000 237000.0
## 24  377727.3 7.400000 4.000000 13.20000   5100.00  2400.000 2100.000 240000.0
## 25 1263888.9 7.500000 3.800000 11.40000  13900.00  7900.000 3900.000 615000.0
## 26 3598875.0 7.223333 4.012903 13.15312   9106.25  5796.875 2090.625 305883.9
## 27  324000.0 6.800000 4.200000 13.50000   5300.00  3300.000 1400.000 235000.0
## 28 2546833.3 7.100000 4.000000 11.70000   6900.00  5900.000  600.000 259000.0
## 29  888857.1 7.500000 3.700000 13.80000  12000.00  5700.000 4000.000 256000.0
## 30 1156272.7 6.300000 4.100000 13.00000   8300.00  4100.000 2900.000 343000.0
## 31 2693250.0 7.223333 4.012903 11.40000   7600.00  4900.000 1300.000 412000.0
## 32 1035000.0 7.500000 4.500000 12.90000   8800.00  5800.000 1800.000 337000.0
## 33 1098200.0 7.700000 4.300000 15.70000   9600.00  5900.000 2200.000 312000.0
## 34  929882.4 6.600000 4.100000 16.30000   8900.00  5000.000 2400.000 254000.0
##       NLR_2C NLR2C_corte4o5      PLR_2C   PNI_2C       SII_2C primera_eval
## 1   1.478261           0.00 110.0000000 56.50000  374000.0000           EE
## 2   5.166667           1.00 105.0000000 43.00000  651000.0000           RP
## 3   1.500000           0.00 109.6666667 59.00000  493500.0000           RP
## 4   2.263158           0.00 133.6842105 50.50000  574842.1053           PS
## 5   1.821429           0.00 111.7857143 59.00000  570107.1429           EE
## 6   2.944444           0.00   0.1583333 54.00000     839.1667           RP
## 7   5.818182           1.00 240.9090909 46.50000 1541818.1818           EE
## 8   3.348731           0.25 177.5906414 50.70968 1134689.6890           RP
## 9   7.000000           1.00 176.5217391 48.50000 2842000.0000           EE
## 10  2.500000           0.00 102.7272727 52.00000  565000.0000           RP
## 11 10.083333           1.00 715.0000000 35.00000 8651500.0000           PE
## 12  1.419355           0.00  83.8709677 54.50000  369032.2581           EE
## 13  1.758621           0.00 110.0000000 56.50000  561000.0000           RP
## 14  2.828571           0.00 116.5714286 57.50000 1154057.1429           EE
## 15  5.642857           1.00 181.4285714 46.00000 1433285.7143           EE
## 16  2.440000           0.00 118.8000000 51.50000  724680.0000           RP
## 17  2.875000           0.00 272.5000000 34.00000  626750.0000           EE
## 18  1.848485           0.00  82.4242424 57.50000  502787.8788           RP
## 19  1.200000           0.00 262.6666667 44.50000  472800.0000           RP
## 20  5.250000           1.00 354.1666667 52.00000 2231250.0000           EE
## 21  5.666667           1.00 144.6666667 51.50000 1229666.6667           PE
## 22  2.000000           0.00 107.7777778 48.00000  388000.0000           EE
## 23  3.700000           0.00 237.0000000 41.00000  876900.0000           RP
## 24  1.142857           0.00 114.2857143 50.50000  274285.7143           EE
## 25  2.025641           0.00 157.6923077 57.50000 1245769.2308           EE
## 26  3.348731           0.25 177.5906414 50.70968 1134689.6890           PE
## 27  2.357143           0.00 167.8571429 49.00000  553928.5714           RP
## 28  9.833333           1.00 431.6666667 43.00000 2546833.3333           PE
## 29  1.425000           0.00  64.0000000 57.00000  364800.0000           EE
## 30  1.413793           0.00 118.2758621 55.50000  484931.0345           EE
## 31  3.769231           0.00 316.9230769 50.70968 1552923.0769           PE
## 32  3.222222           0.00 187.2222222 54.00000 1085888.8889           RP
## 33  2.681818           0.00 141.8181818 54.00000  836727.2727           RP
## 34  2.083333           0.00 105.8333333 53.00000  529166.6667           EE
##    Prot_1eval Alb_1eval Hb_1eval Leucoc_1eval Neutr_1eval Linf_1eval Plaq_1eval
## 1    7.300000       4.4     16.9         8000        5300       2100     262000
## 2    6.000000       3.9     11.2         7500        5500       1300      96000
## 3    7.100000       4.5     16.6         8700        4900       2900     315000
## 4    7.200000       4.0     15.7         7800        4400       2500     259000
## 5    7.087097       4.3     16.5         8700        4600       2800     285000
## 6    7.600000       4.4     15.4         8000        5900       1400     263000
## 7    6.700000       3.9     11.1         7600        6000       1000     229000
## 8    6.400000       4.2     11.6         8600        6300       1400     124000
## 9    6.900000       3.7     12.9        16200       13200       1900     317000
## 10   7.700000       4.5     14.6         7400        4700       1900     219000
## 11   7.000000       3.1      8.8        10200        9100        500     527000
## 12   7.200000       4.0     10.8        11100        7200       2600     227000
## 13   7.100000       4.2     15.1         9100        5000       2900     308000
## 14   8.000000       4.5     12.9        18400       13600       3200     328000
## 15   7.087097       3.8     11.3         9400        7200        900     309000
## 16   7.000000       4.1     15.8         9800        6000       2600     205000
## 17   5.500000       3.6     13.7         4600        2600       1100     220000
## 18   8.500000       4.1     12.7        10200        5400       3100     282000
## 19   7.100000       3.9     12.2         3100        1400       1300     290000
## 20   7.300000       3.7     12.5         9200        7100       1100     400000
## 21   6.400000       3.9      9.9        10000        7500        800     216000
## 22   7.700000       3.9     13.4         6400        3600       1800     194000
## 23   7.087097       3.1     14.9         4500        2900       1000     220000
## 24   7.700000       4.1     13.8         4300        2200       1600     234000
## 25   7.800000       3.9     11.8        13900        7700       4000     647000
## 26   6.400000       3.7     11.7         9000        6300        800     457000
## 27   7.000000       4.2     13.8         4600        3100       1100     257000
## 28   7.100000       4.0     11.7         6900        5900        600     259000
## 29   6.900000       3.9     14.5         9100        4200       3500     199000
## 30   6.300000       4.1     13.0         8300        4100       2900     343000
## 31   7.000000       4.0     11.3         7300        4300       1800     353000
## 32   7.700000       4.6     12.9         9700        6500       2100     308000
## 33   7.500000       4.3     15.9         8700        6000       1600     320000
## 34   6.600000       4.1     16.3         8900        5000       2400     254000
##    NLR_1eval  PLR_1eval PNI_1eval SII_1eval Mejor_resp N_ciclos segunda_eval
## 1   2.523810  124.76190      54.5  661238.1         RC       35    0.5185185
## 2   4.230769   73.84615      45.5  406153.8         RC       35    0.0000000
## 3   1.689655  108.62069      59.5  532241.4         RP        7    0.0000000
## 4   1.760000  103.60000      52.5  455840.0         EE       11    1.0000000
## 5   1.642857  101.78571      57.0  468214.3         EE        7    1.0000000
## 6   4.214286  187.85714      51.0 1108357.1         RC        4    0.5185185
## 7   6.000000  229.00000      44.0 1374000.0         RP       19    1.0000000
## 8   4.500000   88.57143      49.0  558000.0         RP        1    0.0000000
## 9   6.947368  166.84211      46.5 2202315.8         EE        3    0.0000000
## 10  2.473684  115.26316      54.5  541736.8         RP       26    0.0000000
## 11 18.200000 1054.00000      33.5 9591400.0         PE        3    1.0000000
## 12  2.769231   87.30769      53.0  628615.4         RP        5    0.0000000
## 13  1.724138  106.20690      56.5  531034.5         RP       11    1.0000000
## 14  4.250000  102.50000      61.0 1394000.0         EE        6    0.0000000
## 15  8.000000  343.33333      42.5 2472000.0         EE        6    1.0000000
## 16  2.307692   78.84615      54.0  473076.9         RP       32    1.0000000
## 17  2.363636  200.00000      41.5  520000.0         RP       25    0.5185185
## 18  1.741935   90.96774      56.5  491225.8         RP       35    0.5185185
## 19  1.076923  223.07692      45.5  312307.7         RP       16    0.0000000
## 20  6.454545  363.63636      42.5 2581818.2         RC       25    0.0000000
## 21  9.375000  270.00000      43.0 2025000.0         PE        3    0.0000000
## 22  2.000000  107.77778      48.0  388000.0         RP        5    1.0000000
## 23  2.900000  220.00000      36.0  638000.0         RP        8    0.5185185
## 24  1.375000  146.25000      49.0  321750.0         EE        8    1.0000000
## 25  1.925000  161.75000      59.0 1245475.0         EE        8    1.0000000
## 26  7.875000  571.25000      41.0 3598875.0         PE        1    1.0000000
## 27  2.818182  233.63636      47.5  724272.7         RC       35    0.0000000
## 28  9.833333  431.66667      43.0 2546833.3         PE        2    0.0000000
## 29  1.200000   56.85714      56.5  238800.0         RP       27    0.0000000
## 30  1.413793  118.27586      55.5  484931.0         RP       13    1.0000000
## 31  2.388889  196.11111      49.0  843277.8         PE        4    1.0000000
## 32  3.095238  146.66667      56.5  953333.3         RP       35    0.5185185
## 33  3.750000  200.00000      51.0 1200000.0         RP       23    1.0000000
## 34  2.083333  105.83333      53.0  529166.7         RP       35    0.5185185
##    Exitus        SLP SLP_cens        SG SG_cens
## 1       1 29.8644764        1 29.864476       1
## 2       0 60.3860370        1 60.386037       1
## 3       0 35.1868583        0 57.626283       1
## 4       1  7.3921971        0 33.741273       0
## 5       1  4.5010267        0 18.825462       0
## 6       0 41.4948665        1 41.494867       1
## 7       1 24.0164271        0 30.225873       0
## 8       1  7.8850103        1  7.885010       1
## 9       1  1.8069815        0  1.806982       0
## 10      1 19.9425051        1 19.942505       0
## 11      1  1.8726899        0 17.478439       0
## 12      1 40.7392197        1 40.739220       0
## 13      1  7.4579055        0 41.002053       0
## 14      1  5.6509240        0  8.837782       0
## 15      1  3.6796715        0  6.570842       0
## 16      1 22.3737166        0 28.747433       0
## 17      1 21.9794661        1 21.979466       0
## 18      0 46.3244353        1 46.324435       1
## 19      0 35.3182752        0 35.318275       1
## 20      0 45.6344969        1 45.634497       1
## 21      1  1.9055441        0  5.749487       0
## 22      1  7.2607803        0 22.078029       0
## 23      1  9.3305955        1  9.330595       0
## 24      1  7.1293634        0 16.131417       0
## 25      0  5.6180698        0 10.611910       0
## 26      1  0.7556468        0 41.166324       0
## 27      0 31.1457906        1 31.145791       1
## 28      1  1.3798768        0  1.839836       0
## 29      1 17.8069815        0 26.579055       0
## 30      1 11.1704312        0 22.702259       0
## 31      1  1.8069815        0 16.000000       0
## 32      0 40.2135524        1 40.213552       1
## 33      1 16.1642710        0 35.778234       0
## 34      0 39.4579055        1 39.457906       1

Ajustamos el número de decimales:

df_imputado1$Edad_dx <- round(df_imputado1$Edad_dx, 0)
df_imputado1$LDH <- round(df_imputado1$LDH, 0)
df_imputado1$LDH <- round(df_imputado1$LDH, 0)
df_imputado1$Exp_tab <- round(df_imputado1$Exp_tab, 0)
df_imputado1$Col_total <- round(df_imputado1$Col_total, 0)
df_imputado1$Leucoc_1C <- round(df_imputado1$Leucoc_1C, 0)
df_imputado1$Neutr_1C <- round(df_imputado1$Neutr_1C, 0)
df_imputado1$Linf_1C <- round(df_imputado1$Linf_1C, 0)
df_imputado1$Plaq_1C <- round(df_imputado1$Plaq_1C, 0)

df_imputado1$Prot_1C <- round(df_imputado1$Prot_1C, 1)
df_imputado1$Alb_1C <- round(df_imputado1$Alb_1C, 1)
df_imputado1$Hb_1C <- round(df_imputado1$Hb_1C, 1)
df_imputado1$Prot_tot <- round(df_imputado1$Prot_tot, 1)
df_imputado1$Albumina <- round(df_imputado1$Albumina, 1)

df_imputado1$Porcentaje_perdpeso <- round(df_imputado1$Porcentaje_perdpeso, 4)

df_imputado1$NLR_pre <- round(df_imputado1$NLR_pre, 2)
df_imputado1$PLR_pre <- round(df_imputado1$PLR_pre, 2)
df_imputado1$PNI_pre <- round(df_imputado1$PNI_pre, 2)
df_imputado1$ALI_pre <- round(df_imputado1$ALI_pre, 2)
df_imputado1$SII_pre <- round(df_imputado1$SII_pre, 2)
df_imputado1$NLR_1C <- round(df_imputado1$NLR_1C, 2)
df_imputado1$PLR_2C <- round(df_imputado1$PLR_2C, 2)
df_imputado1$SII_2C <- round(df_imputado1$SII_2C, 2)

Como las variables tipo factor nos daban problemas al tener más de dos factores, hemos usado el método cart para este tipo de variables:

imputed_data2 <- mice(df %>% 
                        select(Idpac,Histologia,Afectacion_ganglionar,Afectacion_metastasica,Estadio,Estatinas,primera_eval_num,Mejor_resp_num,Tipo_tox,
                               Tamaño_tumor,Grado_tox,Motivo_inter, NLR1C_corte4, NLR1C_corte5, Histología_num, Estadio_num, Toxicidad,Interrupc_tto,
                               Enf_neurod,Sexo, ECOG, Progresion, Cardiop, Diabetes),
                      method = "cart", print = FALSE)
## Warning: Number of logged events: 150
df_imputado2 <- complete(imputed_data2)
df_imputado2
##    Idpac         Histologia Afectacion_ganglionar Afectacion_metastasica
## 1   P_01     Adenocarcinoma                     2                     1c
## 2   P_02              Otros                     2                     1c
## 3   P_03     Adenocarcinoma                     1                     1c
## 4   P_04           Escamoso                     2                      0
## 5   P_05           Escamoso                     2                     1a
## 6   P_06              Otros                     3                     1c
## 7   P_07           Escamoso                     2                     1c
## 8   P_08           Escamoso                     2                      0
## 9   P_09           Escamoso                     2                      0
## 10  P_10     Adenocarcinoma                     2                     1c
## 11  P_11     Adenocarcinoma                     3                     1c
## 12  P_12     Adenocarcinoma                     1                     1b
## 13  P_13     Adenocarcinoma                     3                     1a
## 14  P_14              Otros                     0                     1b
## 15  P_15     Adenocarcinoma                     0                     1c
## 16  P_16     Adenocarcinoma                     2                     1b
## 17  P_18     Adenocarcinoma                     2                     1c
## 18  P_19     Adenocarcinoma                     3                     1c
## 19  P_20 Ca. indiferenciado                     2                     1c
## 20  P_22     Adenocarcinoma                     x                     1a
## 21  P_23     Adenocarcinoma                     0                     1c
## 22  P_24           Escamoso                     2                     1c
## 23  P_25     Adenocarcinoma                     3                     1c
## 24  P_26     Adenocarcinoma                     2                     1c
## 25  P_27     Adenocarcinoma                     3                     1c
## 26  P_28     Adenocarcinoma                     3                     1c
## 27  P_29              Otros                     3                     1b
## 28  P_30     Adenocarcinoma                     3                     1b
## 29  P_31     Adenocarcinoma                     2                     1a
## 30  P_32     Adenocarcinoma                     3                     1c
## 31  P_33     Adenocarcinoma                     2                     1b
## 32  P_34              Otros                     3                      0
## 33  P_35     Adenocarcinoma                     2                     1c
## 34  P_36     Adenocarcinoma                     0                     1c
##    Estadio   Estatinas primera_eval_num Mejor_resp_num              Tipo_tox
## 1      IVB           0                2              0           Miocarditis
## 2      IVB           0                1              0            Dermatitis
## 3      IVB           1                1              1             Hepatitis
## 4     IIIB           1                2              2                     0
## 5      IVA           0                2              2                     0
## 6      IVB           0                1              0               Uveítis
## 7      IVB           1                2              1            Neumonitis
## 8     IIIA           0                1              1             Hepatitis
## 9     IIIB           1                2              2                     0
## 10     IVB           0                1              1               Uveítis
## 11     IVB           0                3              3                     0
## 12     IVA           1                2              1            Neumonitis
## 13     IVA           0                1              1 Queratitis/Dermatitis
## 14     IVA           0                2              2                     0
## 15     IVB           0                2              2            Dermatitis
## 16     IVB           0                1              1              Artritis
## 17     IVB           0                2              1                     0
## 18     IVB           0                1              1            Tiroiditis
## 19     IVB           0                1              1           Encefalitis
## 20     IVA           0                1              0            Neumonitis
## 21     IVB           1                3              3                     0
## 22     IVB           0                2              1            Neumonitis
## 23     IVB           0                1              1                     0
## 24     IVB           0                2              2                     0
## 25     IVB 0 (fibrato)                1              1                     0
## 26     IVB           1                3              3                     0
## 27     IVB           0                1              0            Tiroiditis
## 28     IVB           0                3              3                     0
## 29     IVA           0                3              2            Dermatitis
## 30     IVB           0                2              1            Dermatitis
## 31     IVB           0                3              3                     0
## 32    IIIC           1                1              1                     0
## 33     IVB           1                1              1                     0
## 34     IVB           0                2              1              Artritis
##    Tamaño_tumor Grado_tox                 Motivo_inter NLR1C_corte4
## 1            2b         3 Fin del tratamiento previsto            0
## 2             X         1 Fin del tratamiento previsto            1
## 3            2b         3                    Toxicidad            0
## 4             4         0                   Progresión            0
## 5            2a         0                   Progresión            0
## 6             x         2                    Toxicidad            0
## 7             3         3                    Toxicidad            0
## 8            1c         3                    Toxicidad            0
## 9             4         0                       Exitus            1
## 10            3         1          Exitus (otra causa)            1
## 11            4         0                   Progresión            1
## 12           2b         3                    Toxicidad            0
## 13            4         1                   Progresión            0
## 14            x         0                   Progresión            1
## 15            4         1                   Progresión            1
## 16            x         1                   Progresión            0
## 17           2b         0          Exitus (otra causa)            1
## 18            4         1 Fin del tratamiento previsto            0
## 19            4         3                    Toxicidad            0
## 20            x         2                    Toxicidad            1
## 21            3         0                   Progresión            1
## 22            3         3                    Toxicidad            0
## 23            3         0    2º tumor/ hepatocarcinoma            0
## 24            4         0                   Progresión            0
## 25            4         0                   Progresión            0
## 26            4         0                   Progresión            1
## 27            4         2 Fin del tratamiento previsto            0
## 28            4         0                   Progresión            1
## 29            4         3                    Toxicidad            0
## 30            4         1                   Progresión            0
## 31            4         0                   Progresión            0
## 32            3         0 Fin del tratamiento previsto            0
## 33            4         0                   Progresión            0
## 34            4        G2 Fin del tratamiento previsto            1
##    NLR1C_corte5 Histología_num Estadio_num Toxicidad Interrupc_tto Enf_neurod
## 1             0              0           4         1             1          0
## 2             1              2           4         1             1          0
## 3             0              0           4         1             1          0
## 4             0              1           3         0             1          0
## 5             0              1           4         0             1          0
## 6             0              2           4         1             1          0
## 7             0              1           4         1             1          0
## 8             0              1           3         1             1          1
## 9             0              1           3         0             1          1
## 10            1              0           4         1             1          0
## 11            1              0           4         0             1          0
## 12            0              0           4         0             1          0
## 13            0              0           4         1             1          0
## 14            0              2           4         0             1          0
## 15            1              0           4         1             1          0
## 16            0              0           4         1             1          0
## 17            0              0           4         0             1          0
## 18            0              0           4         1             1          0
## 19            0              2           4         1             1          0
## 20            1              0           4         1             1          0
## 21            1              0           4         0             1          1
## 22            0              1           4         1             1          0
## 23            0              0           4         0             1          0
## 24            0              0           4         0             1          0
## 25            0              0           4         0             1          0
## 26            1              0           4         0             1          0
## 27            0              2           4         1             1          0
## 28            1              0           4         0             1          0
## 29            0              0           4         1             1          0
## 30            0              0           4         1             1          0
## 31            0              0           4         0             1          0
## 32            0              2           3         0             1          0
## 33            0              0           4         0             0          0
## 34            0              0           4         1             1          0
##    Sexo ECOG Progresion Cardiop Diabetes
## 1     2    1          0       0        0
## 2     1    2          0       0        0
## 3     2    0          1       0        0
## 4     2    0          1       1        0
## 5     2    1          1       0        0
## 6     2    1          0       0        0
## 7     1    1          1       0        1
## 8     2    2          0       1        0
## 9     2    1          1       1        0
## 10    2    1          0       0        0
## 11    2    2          1       0        0
## 12    2    1          0       1        0
## 13    1    1          1       0        1
## 14    2    1          1       0        0
## 15    1    2          1       0        0
## 16    2    1          1       0        0
## 17    1    0          0       0        0
## 18    2    1          0       0        0
## 19    1    1          1       0        0
## 20    2    0          0       0        0
## 21    2    2          1       0        1
## 22    2    1          1       0        0
## 23    2    1          0       0        0
## 24    1    1          1       0        0
## 25    2    1          1       0        0
## 26    1    1          1       0        0
## 27    1    1          0       0        0
## 28    2    1          1       0        0
## 29    2    1          1       0        0
## 30    2    1          1       0        0
## 31    2    1          1       0        0
## 32    2    0          0       0        1
## 33    1    2          1       0        0
## 34    2    1          0       0        0

Redondeamos los valores de las variables factor para que no nos den decimales:

redondear = c("Idpac","Histologia","Afectacion_ganglionar","Afectacion_metastasica","Estadio","Estatinas","primera_eval_num","Mejor_resp_num",
              "Tipo_tox","Tamaño_tumor","Grado_tox","Motivo_inter","NLR1C_corte4","NLR1C_corte5","Histología_num","Estadio_num","Toxicidad","Interrupc_tto",
              "Enf_neurod","Sexo","ECOG","Progresion","Cardiop","Diabetes")

sapply(df_imputado2[redondear], class)
##                  Idpac             Histologia  Afectacion_ganglionar 
##               "factor"               "factor"               "factor" 
## Afectacion_metastasica                Estadio              Estatinas 
##               "factor"               "factor"               "factor" 
##       primera_eval_num         Mejor_resp_num               Tipo_tox 
##               "factor"               "factor"               "factor" 
##           Tamaño_tumor              Grado_tox           Motivo_inter 
##               "factor"               "factor"               "factor" 
##           NLR1C_corte4           NLR1C_corte5         Histología_num 
##               "factor"               "factor"               "factor" 
##            Estadio_num              Toxicidad          Interrupc_tto 
##               "factor"               "factor"               "factor" 
##             Enf_neurod                   Sexo                   ECOG 
##               "factor"               "factor"               "factor" 
##             Progresion                Cardiop               Diabetes 
##               "factor"               "factor"               "factor"
df_imputado2[redondear] <- lapply(df_imputado2[redondear], as.numeric)

df_imputado2[redondear] <- round(df_imputado2[redondear], 0)
# Convertir todas las columnas a factores
df_imputado2 <- lapply(df_imputado2, as.factor)

Finalmente hemos unificado todo en un único dataframe sin datos faltantes.

df_completo <- cbind(df_imputado1, df_imputado2)

Arreglamos las varibles primera_eval_num y mejor_respuesta_num:

asignar_valor_primera_eval <- function(valor) {
  if (valor == "RP") {
    return(1)
  } else if (valor %in% c("PS", "EE")) {
    return(2)
  } else if (valor == "PE") {
    return(3)
  } else {
    return(NA)  # Manejo de otros valores, si es necesario
  }
}

df_completo <- df_completo %>% 
  mutate(pri_eval_num_ok = sapply(primera_eval, asignar_valor_primera_eval))
asignar_valor_mejor_resp <- function(valor) {
  if (valor == "RC") {
    return(0)
  } else if (valor == "RP") {
    return(1)
  } else if (valor == "EE") {
    return(2)
  } else if (valor == "PE") {
    return(3)
  } else {
    return(NA)  # Manejo de otros valores, si es necesario
  }
}

df_completo <- df_completo %>% 
  mutate(mejor_resp_num_ok = sapply(Mejor_resp, asignar_valor_mejor_resp))

4 ANÁLISIS DESCRIPTIVO:

Análisis exploratorio de nuestras variables numéricas:

# Obtener las columnas numéricas del dataframe
columnas_numericas <- sapply(df_completo, is.numeric)

# Iterar sobre cada columna numérica
for (columna in names(df_completo[columnas_numericas])) {
  # Resumen estadístico
  cat("Variable:", columna, "\n")
  cat("Resumen estadístico:\n")
  print(summary(df_completo[[columna]]))
  
  # Histograma
  cat("Histograma:\n")
  hist(df_completo[[columna]], main = paste("Histograma de", columna), xlab = columna)
  
  # Boxplot
  cat("Boxplot:\n")
  boxplot(df_completo[[columna]], main = paste("Boxplot de", columna))
  
  # Gráfico de densidad
  cat("Gráfico de densidad:\n")
  plot(density(df_completo[[columna]]), main = paste("Densidad de", columna))
  
  cat("\n")
}
## Variable: Edad_dx 
## Resumen estadístico:
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   46.00   60.00   65.50   65.35   71.00   82.00 
## Histograma:

## Boxplot:

## Gráfico de densidad:

## 
## Variable: Anciano 
## Resumen estadístico:
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##  0.0000  0.0000  0.0000  0.3529  1.0000  1.0000 
## Histograma:

## Boxplot:

## Gráfico de densidad:

## 
## Variable: Peso 
## Resumen estadístico:
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   47.00   62.25   67.00   70.16   77.28  102.00 
## Histograma:

## Boxplot:

## Gráfico de densidad:

## 
## Variable: Talla 
## Resumen estadístico:
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   1.500   1.593   1.630   1.656   1.728   1.910 
## Histograma:

## Boxplot:

## Gráfico de densidad:

## 
## Variable: IMC 
## Resumen estadístico:
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   18.36   22.53   25.11   25.57   28.21   35.63 
## Histograma:

## Boxplot:

## Gráfico de densidad:

## 
## Variable: Porcentaje_perdpeso 
## Resumen estadístico:
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
## 0.00000 0.00000 0.03450 0.04584 0.07300 0.22900 
## Histograma:

## Boxplot:

## Gráfico de densidad:

## 
## Variable: Exp_tab 
## Resumen estadístico:
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##    0.00   37.00   50.00   51.68   60.00  200.00 
## Histograma:

## Boxplot:

## Gráfico de densidad:

## 
## Variable: PD_L1 
## Resumen estadístico:
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##    2.00   70.00   80.00   78.88   93.75  100.00 
## Histograma:

## Boxplot:

## Gráfico de densidad:

## 
## Variable: Col_total 
## Resumen estadístico:
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   111.0   153.2   189.0   187.4   205.0   397.0 
## Histograma:

## Boxplot:

## Gráfico de densidad:

## 
## Variable: LDH 
## Resumen estadístico:
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   156.0   184.0   200.0   263.7   264.0  1644.0 
## Histograma:

## Boxplot:

## Gráfico de densidad:

## 
## Variable: Prot_tot 
## Resumen estadístico:
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   5.400   6.900   7.000   7.006   7.300   8.900 
## Histograma:

## Boxplot:

## Gráfico de densidad:

## 
## Variable: Albumina 
## Resumen estadístico:
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   2.800   3.700   4.000   3.912   4.200   4.400 
## Histograma:

## Boxplot:

## Gráfico de densidad:

## 
## Variable: Hb 
## Resumen estadístico:
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   10.60   11.95   13.00   13.16   14.07   16.70 
## Histograma:

## Boxplot:

## Gráfico de densidad:

## 
## Variable: Leucoc_tot 
## Resumen estadístico:
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##    4000    7625    9850   10012   12300   20500 
## Histograma:

## Boxplot:

## Gráfico de densidad:

## 
## Variable: Neutrofilos 
## Resumen estadístico:
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##    2500    5075    7200    7162    8700   13400 
## Histograma:

## Boxplot:

## Gráfico de densidad:

## 
## Variable: Linf_tot 
## Resumen estadístico:
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##     400    1125    1500    1650    2150    3500 
## Histograma:

## Boxplot:

## Gráfico de densidad:

## 
## Variable: Plaquetas 
## Resumen estadístico:
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##  112000  229500  283000  298941  337250  709000 
## Histograma:

## Boxplot:

## Gráfico de densidad:

## 
## Variable: NLR_pre 
## Resumen estadístico:
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   1.670   2.925   3.830   5.940   6.060  24.600 
## Histograma:

## Boxplot:

## Gráfico de densidad:

## 
## Variable: PLR_pre 
## Resumen estadístico:
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##    71.5   131.7   177.2   232.9   251.0   928.0 
## Histograma:

## Boxplot:

## Gráfico de densidad:

## 
## Variable: PNI_pre 
## Resumen estadístico:
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   32.00   45.50   48.75   47.42   50.88   59.50 
## Histograma:

## Boxplot:

## Gráfico de densidad:

## 
## Variable: ALI_pre 
## Resumen estadístico:
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##    3.20   14.64   26.42   26.86   32.73   67.80 
## Histograma:

## Boxplot:

## Gráfico de densidad:

## 
## Variable: SII_pre 
## Resumen estadístico:
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##  250250  907950 1076325 1689960 1905679 8723200 
## Histograma:

## Boxplot:

## Gráfico de densidad:

## 
## Variable: Prot_1C 
## Resumen estadístico:
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   4.600   6.800   7.050   7.044   7.375   9.100 
## Histograma:

## Boxplot:

## Gráfico de densidad:

## 
## Variable: Alb_1C 
## Resumen estadístico:
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   3.100   3.700   3.950   3.906   4.100   4.600 
## Histograma:

## Boxplot:

## Gráfico de densidad:

## 
## Variable: Hb_1C 
## Resumen estadístico:
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##    8.40   11.60   12.30   12.89   14.50   16.10 
## Histograma:

## Boxplot:

## Gráfico de densidad:

## 
## Variable: Leucoc_1C 
## Resumen estadístico:
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##    3600    7325    9100    9435   12375   16100 
## Histograma:

## Boxplot:

## Gráfico de densidad:

## 
## Variable: Neutr_1C 
## Resumen estadístico:
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##    1700    4450    6250    6318    8300   12100 
## Histograma:

## Boxplot:

## Gráfico de densidad:

## 
## Variable: Linf_1C 
## Resumen estadístico:
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##     600    1100    1750    1894    2725    3600 
## Histograma:

## Boxplot:

## Gráfico de densidad:

## 
## Variable: Plaq_1C 
## Resumen estadístico:
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##  112000  246250  330500  336206  428500  650000 
## Histograma:

## Boxplot:

## Gráfico de densidad:

## 
## Variable: NLR_1C 
## Resumen estadístico:
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   1.280   2.095   3.255   4.040   5.048  10.400 
## Histograma:

## Boxplot:

## Gráfico de densidad:

## 
## Variable: PLR_1C 
## Resumen estadístico:
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   83.45  127.03  160.43  211.81  250.80  571.25 
## Histograma:

## Boxplot:

## Gráfico de densidad:

## 
## Variable: PNI_1C 
## Resumen estadístico:
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   10.00   43.00   49.25   47.33   53.88   60.50 
## Histograma:

## Boxplot:

## Gráfico de densidad:

## 
## Variable: SII_1C 
## Resumen estadístico:
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##  276556  763778 1050214 1341856 1505244 4815200 
## Histograma:

## Boxplot:

## Gráfico de densidad:

## 
## Variable: Prot_2C 
## Resumen estadístico:
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   5.300   6.950   7.212   7.223   7.500   8.800 
## Histograma:

## Boxplot:

## Gráfico de densidad:

## 
## Variable: Alb_2C 
## Resumen estadístico:
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   2.900   3.900   4.013   4.013   4.200   4.600 
## Histograma:

## Boxplot:

## Gráfico de densidad:

## 
## Variable: Hb_2C 
## Resumen estadístico:
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##    8.60   11.45   13.15   13.15   14.70   16.70 
## Histograma:

## Boxplot:

## Gráfico de densidad:

## 
## Variable: Leucoc_2C 
## Resumen estadístico:
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##    3800    7300    8750    9106   10125   19400 
## Histograma:

## Boxplot:

## Gráfico de densidad:

## 
## Variable: Neutr_2C 
## Resumen estadístico:
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##    1800    4325    5600    5797    6175   16100 
## Histograma:

## Boxplot:

## Gráfico de densidad:

## 
## Variable: Linf_2C 
## Resumen estadístico:
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##     600    1400    2091    2091    2725    4000 
## Histograma:

## Boxplot:

## Gráfico de densidad:

## 
## Variable: Plaq_2C 
## Resumen estadístico:
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##     285  243250  268500  305884  335000  858000 
## Histograma:

## Boxplot:

## Gráfico de densidad:

## 
## Variable: NLR_2C 
## Resumen estadístico:
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   1.143   1.828   2.591   3.349   3.752  10.083 
## Histograma:

## Boxplot:

## Gráfico de densidad:

## 
## Variable: NLR2C_corte4o5 
## Resumen estadístico:
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##    0.00    0.00    0.00    0.25    0.25    1.00 
## Histograma:

## Boxplot:

## Gráfico de densidad:

## 
## Variable: PLR_2C 
## Resumen estadístico:
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##    0.16  109.75  137.75  177.59  185.77  715.00 
## Histograma:

## Boxplot:

## Gráfico de densidad:

## 
## Variable: PNI_2C 
## Resumen estadístico:
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   34.00   48.12   51.50   50.71   55.25   59.00 
## Histograma:

## Boxplot:

## Gráfico de densidad:

## 
## Variable: SII_2C 
## Resumen estadístico:
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##     839  495822  638875 1134690 1210764 8651500 
## Histograma:

## Boxplot:

## Gráfico de densidad:

## 
## Variable: Prot_1eval 
## Resumen estadístico:
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   5.500   6.900   7.094   7.087   7.450   8.500 
## Histograma:

## Boxplot:

## Gráfico de densidad:

## 
## Variable: Alb_1eval 
## Resumen estadístico:
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   3.100   3.900   4.000   4.018   4.200   4.600 
## Histograma:

## Boxplot:

## Gráfico de densidad:

## 
## Variable: Hb_1eval 
## Resumen estadístico:
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##    8.80   11.70   12.95   13.33   15.05   16.90 
## Histograma:

## Boxplot:

## Gráfico de densidad:

## 
## Variable: Leucoc_1eval 
## Resumen estadístico:
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##    3100    7425    8700    8682    9625   18400 
## Histograma:

## Boxplot:

## Gráfico de densidad:

## 
## Variable: Neutr_1eval 
## Resumen estadístico:
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##    1400    4325    5450    5726    6450   13600 
## Histograma:

## Boxplot:

## Gráfico de densidad:

## 
## Variable: Linf_1eval 
## Resumen estadístico:
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##     500    1100    1800    1897    2600    4000 
## Histograma:

## Boxplot:

## Gráfico de densidad:

## 
## Variable: Plaq_1eval 
## Resumen estadístico:
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   96000  221750  262500  286059  316500  647000 
## Histograma:

## Boxplot:

## Gráfico de densidad:

## 
## Variable: NLR_1eval 
## Resumen estadístico:
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   1.077   1.801   2.647   4.027   4.438  18.200 
## Histograma:

## Boxplot:

## Gráfico de densidad:

## 
## Variable: PLR_1eval 
## Resumen estadístico:
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   56.86  104.16  146.46  203.41  222.31 1054.00 
## Histograma:

## Boxplot:

## Gráfico de densidad:

## 
## Variable: PNI_1eval 
## Resumen estadístico:
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   33.50   44.38   50.00   49.66   55.25   61.00 
## Histograma:

## Boxplot:

## Gráfico de densidad:

## 
## Variable: SII_1eval 
## Resumen estadístico:
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##  238800  486505  633308 1265920 1341869 9591400 
## Histograma:

## Boxplot:

## Gráfico de densidad:

## 
## Variable: N_ciclos 
## Resumen estadístico:
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##    1.00    5.00    9.50   15.26   25.75   35.00 
## Histograma:

## Boxplot:

## Gráfico de densidad:

## 
## Variable: segunda_eval 
## Resumen estadístico:
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##  0.0000  0.0000  0.5185  0.5185  1.0000  1.0000 
## Histograma:

## Boxplot:

## Gráfico de densidad:

## 
## Variable: Exitus 
## Resumen estadístico:
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##  0.0000  0.0000  1.0000  0.7059  1.0000  1.0000 
## Histograma:

## Boxplot:

## Gráfico de densidad:

## 
## Variable: SLP 
## Resumen estadístico:
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##  0.7557  5.6263 13.6674 19.2545 34.1766 60.3860 
## Histograma:

## Boxplot:

## Gráfico de densidad:

## 
## Variable: SLP_cens 
## Resumen estadístico:
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##  0.0000  0.0000  0.0000  0.3824  1.0000  1.0000 
## Histograma:

## Boxplot:

## Gráfico de densidad:

## 
## Variable: SG 
## Resumen estadístico:
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   1.807  16.033  27.663  26.859  40.025  60.386 
## Histograma:

## Boxplot:

## Gráfico de densidad:

## 
## Variable: SG_cens 
## Resumen estadístico:
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##  0.0000  0.0000  0.0000  0.3235  1.0000  1.0000 
## Histograma:

## Boxplot:

## Gráfico de densidad:

## 
## Variable: pri_eval_num_ok 
## Resumen estadístico:
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   1.000   1.000   2.000   1.765   2.000   3.000 
## Histograma:

## Boxplot:

## Gráfico de densidad:

## 
## Variable: mejor_resp_num_ok 
## Resumen estadístico:
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   0.000   1.000   1.000   1.353   2.000   3.000 
## Histograma:

## Boxplot:

## Gráfico de densidad:

Análisis exploratorio de las variables tipo factor:

# Obtener las columnas categóricas del dataframe
columnas_categoricas <- sapply(df_completo, is.factor)

# Iterar sobre cada columna categórica
for (columna in names(df_completo[columnas_categoricas])) {
  # Tabla de frecuencia
  cat("Variable:", columna, "\n")
  cat("Tabla de frecuencia:\n")
  print(table(df_completo[[columna]]))
  
  # Gráfico de barras
  cat("Gráfico de barras:\n")
  barplot(table(df_completo[[columna]]), main = paste("Gráfico de barras de", columna))
  
  # Gráfico de pastel
  cat("Gráfico de pastel:\n")
  pie(table(df_completo[[columna]]), main = paste("Gráfico de pastel de", columna))
  
  cat("\n")
}
## Variable: Idpac 
## Tabla de frecuencia:
## 
##  1  2  3  4  5  6  7  8  9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 
##  1  1  1  1  1  1  1  1  1  1  1  1  1  1  1  1  1  1  1  1  1  1  1  1  1  1 
## 27 28 29 30 31 32 33 34 
##  1  1  1  1  1  1  1  1 
## Gráfico de barras:

## Gráfico de pastel:

## 
## Variable: Histologia 
## Tabla de frecuencia:
## 
##  1  2  3  4 
## 22  1  6  5 
## Gráfico de barras:

## Gráfico de pastel:

## 
## Variable: Afectacion_ganglionar 
## Tabla de frecuencia:
## 
##  1  2  3  4  5 
##  4  2 16 11  1 
## Gráfico de barras:

## Gráfico de pastel:

## 
## Variable: Afectacion_metastasica 
## Tabla de frecuencia:
## 
##  1  2  3  4 
##  4  4  6 20 
## Gráfico de barras:

## Gráfico de pastel:

## 
## Variable: Estadio 
## Tabla de frecuencia:
## 
##  1  2  3  4  5 
##  1  2  1  6 24 
## Gráfico de barras:

## Gráfico de pastel:

## 
## Variable: Estatinas 
## Tabla de frecuencia:
## 
##  1  2  3 
## 24  1  9 
## Gráfico de barras:

## Gráfico de pastel:

## 
## Variable: primera_eval_num 
## Tabla de frecuencia:
## 
##  1  2  3 
## 15 13  6 
## Gráfico de barras:

## Gráfico de pastel:

## 
## Variable: Mejor_resp_num 
## Tabla de frecuencia:
## 
##  1  2  3  4 
##  5 17  7  5 
## Gráfico de barras:

## Gráfico de pastel:

## 
## Variable: Tipo_tox 
## Tabla de frecuencia:
## 
##  1  2  3  4  5  6  7  8  9 10 
## 15  2  4  1  2  1  4  1  2  2 
## Gráfico de barras:

## Gráfico de pastel:

## 
## Variable: Tamaño_tumor 
## Tabla de frecuencia:
## 
##  1  2  3  4  5  6  7 
##  1  1  4  6 17  4  1 
## Gráfico de barras:

## Gráfico de pastel:

## 
## Variable: Grado_tox 
## Tabla de frecuencia:
## 
##  1  2  3  4  5 
## 15  7  3  8  1 
## Gráfico de barras:

## Gráfico de pastel:

## 
## Variable: Motivo_inter 
## Tabla de frecuencia:
## 
##  1  2  3  4  5  6 
##  1  1  2  6 15  9 
## Gráfico de barras:

## Gráfico de pastel:

## 
## Variable: NLR1C_corte4 
## Tabla de frecuencia:
## 
##  1  2 
## 22 12 
## Gráfico de barras:

## Gráfico de pastel:

## 
## Variable: NLR1C_corte5 
## Tabla de frecuencia:
## 
##  1  2 
## 26  8 
## Gráfico de barras:

## Gráfico de pastel:

## 
## Variable: Histología_num 
## Tabla de frecuencia:
## 
##  1  2  3 
## 22  6  6 
## Gráfico de barras:

## Gráfico de pastel:

## 
## Variable: Estadio_num 
## Tabla de frecuencia:
## 
##  1  2 
##  4 30 
## Gráfico de barras:

## Gráfico de pastel:

## 
## Variable: Toxicidad 
## Tabla de frecuencia:
## 
##  1  2 
## 16 18 
## Gráfico de barras:

## Gráfico de pastel:

## 
## Variable: Interrupc_tto 
## Tabla de frecuencia:
## 
##  1  2 
##  1 33 
## Gráfico de barras:

## Gráfico de pastel:

## 
## Variable: Enf_neurod 
## Tabla de frecuencia:
## 
##  1  2 
## 31  3 
## Gráfico de barras:

## Gráfico de pastel:

## 
## Variable: Sexo 
## Tabla de frecuencia:
## 
##  1  2 
## 10 24 
## Gráfico de barras:

## Gráfico de pastel:

## 
## Variable: ECOG 
## Tabla de frecuencia:
## 
##  1  2  3 
##  5 23  6 
## Gráfico de barras:

## Gráfico de pastel:

## 
## Variable: Progresion 
## Tabla de frecuencia:
## 
##  1  2 
## 13 21 
## Gráfico de barras:

## Gráfico de pastel:

## 
## Variable: Cardiop 
## Tabla de frecuencia:
## 
##  1  2 
## 30  4 
## Gráfico de barras:

## Gráfico de pastel:

## 
## Variable: Diabetes 
## Tabla de frecuencia:
## 
##  1  2 
## 30  4 
## Gráfico de barras:

## Gráfico de pastel:

# ruta_archivo <- "C:/Users/magob/Desktop/PROYECTO/df_definitivo.xlsx"
# 
# write.xlsx(df_completo, file = ruta_archivo, rowNames = TRUE)
# 
# if (file.exists(ruta_archivo)) {
#   cat("¡Los datos se han guardado exitosamente en", ruta_archivo, "!\n")
# } else {
#   cat("Hubo un problema al guardar los datos. Por favor, verifica la ruta y el nombre del archivo.\n")
# }